Google şirkətinin süni zəka sahəsindəki növbəti məhsulu AudioPaLM adlı multimodal dil modeli olub. Sözügedən dil modeli mətn formatında olan kontentlərlə yanaşı danışıq nitqini də tərtib və emal edə bilir. Bununla yanaşı bu dil modeli əsasında çalışan neyron şəbəkəsi həm səs vasitəsilə ünsiyyət qura həm də yüksək dəqiqliklə digər dillərə tərcümə edə bilir. AudioPaLM multimodal dil modeli PaLM-2 adlı böyük dil modelinin imkanları ilə AudioLM adlı audio modelin imkanlarının birləşdirilməsi hesabına ərsəyə gəlib.
PaLM-2 öz növbəsində linqvistik biliklərin analizinə, AudioLM isə danışıq nitqinin və danışıq intonasiyasının təyininə hədəflənib. Google mütəxəssislərinin sözlərinə əsasən AudioPaLM bir dildən digərinə tərcümə imkanına sahibdir və şifahi nitqi digər dildə mətn formatına çevirə bilir. Bundan əlavə olaraq AudioPaLM paralinqvistik məlumatları özündə saxlaya bilir. Söhbət, danışan şəxsin kimliyi ilə danışıq intonasiyasından gedir. AudioPaLM-ın kommersiya məqsədli istifadəsinə nə zaman start veriləcəyi barəsində məlumat daha sonra veriləcək.